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[摘要 ] 科研 数据 是 科学 发 展 的 一 个 重要 部 分 ,而 且 作为 一 种 知识 资产 , 它 也 是 图 书馆 知识 管理 的 一 项 新 兴 挑 战 。 科 丰 
数据 权益 是 进行 科研 数据 管理 的 关键 , 它 的 基本 框架 包括 :利益 相关 方 的 权益 不 同学 科 的 管理 方式 不 同 层级 的 管理 政 
策 、 使 用 与 引用 的 权益 、 存 储 与 传播 的 权益 、 公 共 共 享 的 权益 等 。 在 考虑 现 阶段 我 国 科 研 数据 管理 与 服务 的 需求 后 ,最 终 
提出 面向 科研 工作 流程 的 科研 数据 权益 管理 的 未 来 工作 。 
[关键 词 ] 数据 密集 型 科学 发 现 放 科 研 数据 ”科研 生命 周期 ”数据 生命 周期 ”科研 数据 管理 ”知识 产权 
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[Abstract] Research data is an important part of science development, and as a kind of knowledge asset, it is also a new 
challenge on the library knowledge management. Research data is the key of research data management, and its basic 
framework includes the rights of stakeholders, the management approach at difference disciplines, the implementation poli- 
cies at different levels, the rights of use and citation, the rights of deposit and communication, the rights of public sharing and 
so on. Based consideration of the present stage of needs of research data management and service, the article finally propos- 
als a future work of the research-workflow oriented data right and interest management. 

[Key words]  Data-intensive scientific discovery Open research data Research life-cycle Data life-cycle Research 
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1 科研 事业 、 科 研 数据 与 图 书馆 构成 科学 的 两 大 部 分 是 机 灵巧 智 的 论述 以 及 严谨 可 
发 布 科学 理论 及 其 实证 和 观察 数据 是 其 他 人 交 靠 的 证 据 , 如同 胡适 所 言 : “大胆 假 设 , 小 心 求证 "一 一 


y | E 、 人 的 gp n 在 人 思想 [1 4 NO] S 
断 、 同 意 、 拒 绝 、 理 解 该 项 EI d o R a FOUL GE SA. 

、 ` A EN . Ber 起 5 - PEOR: FFE DE 业 》 ;针对 现代 条 
RAE 成 果 具 有 几 个 重 要 意义 :科学 A a p z 家 


" ee g jata MEN i a FRR SS BEES 数据 放 共 F S38. “数据 必须 容 
论 的 成 立 ,需要 经 过 科学 社 群 的 认 Hj ,经 过 专家 1 yj 5 z ft rm 便 J 找 = ,让 想 检 查 数 EAA SEG ppc. 


A J 
问题 和 解决 方案 的 认识 以 及 识别 ,得 到 认可 ;@ 科 学 理解 数据 ,数据 必须 可 以 被 评价 ,好 让 人 们 ae 
是 为 社会 服务 \ 为 人 类 全 体 福 社 而 不 断 自我 追求 和 的 可 靠 性 和 研究 者 的 能 力 ;数据 也 必须 让 其 他 人 能 够 
我 进步 ,因此 科研 成 果 应 该 尽 可 能 地 为 公众 所 知 并 使 用 "2 。 之 所 以 提出 这 条 呼吁 和 要 求 , 有 其 深远 的 
利用 在 帮助 人 们 的 实践 行动 中 ;四 就 科学 本 身 而 言 ， 科学 文化 断层 隐忧 ,也 有 其 对 图 书 情报 事业 的 期 望 与 
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寄托 。 报 服务 或 者 知识 服务 ,而 且 还 是 图 书馆 事业 支持 科 
的 重要 组 成 部 分 一 一 学 术 期 刊 , 源 技 创新 和 社会 发 展 的 当前 以 及 未 来 重要 推进 方向 。 
纪 科学 家 们 的 通信 。 科 研 成 果 中 的 论述 和 ”2 我 国 的 科研 数据 管理 服务 的 实践 综述 


期 十 八 世 
证 据 两 大 部 分 ( 即 : 思 想 和 证 据 ) 被 同时 刊载 在 后 来 逐 过 年来, 科研 数据 服务 在 我 国 图 书馆 界 于 勃发 
步 由 皇家 学 会 等 机 关 所 发 展 的 这 些 科 学 通讯 中 。 然 E ,近期 CALIS 的 几 项 研究 成 果 ,包括 ,对 国外 政策 以 
而 , 随 着 科研 发 展 的 迅速 扩展 ,许多 证 据 ( 即 ;下文 所 — 及 国内 科研 教育 体系 的 科研 数据 服务 发 展 中 、 汇 整 攻 
述 的 科研 数据 ) 不 得 不 被 省 略 : 比较 一 下 至 德尔 的 遗 。。 外 高 校 的 科研 数据 生命 周期 的 管理 模型 中 、 国 内 外 高 
传 学 说 的 证 据 和 当前 基因 组 序列 的 证 据 , 就 能 明和 纸 校 数 据 共 享 平台 的 整理 上 、 国 内 高 校 用 户 对 科研 数据 
本 期 刊 难以 刊载 所 有 支持 论文 论点 的 数据 。 而 且 出 。 管理 的 需求 调查 中、 武汉 大 学 图 书馆 实行 科研 数据 管 
于 种 种 原因 (如 商业 化 期 刊 科 学 评价 、 急 功 近 利 的 科 理 的 案例 分 析 口 ,以 及 建立 科研 数据 知识 库 的 经 验 总 
研 人 员 等 ) ,使 得 一 些 科 学 不 端 行为 混杂 其 中 (如 刻意 结 中 等 。 这 些 内 容 是 我 国 科研 教育 图 书馆 ,发 展 与 实 
去 呈现 还 存在 若干 不 利 论文 论点 的 实验 数据 等 ) 。 施 科 研 数 据 管理 服务 的 重要 基础 。 

此 ,导致 了 一 个 问题 ;构成 科学 理论 的 两 大 部 科研 数据 权益 管理 是 科研 数据 服务 是 否 可 持续 
分 被 一 切 为 二 ,思想 论述 犹 为 可 见 , 而 实验 数据 则 难 发 展 重点 。 在 科研 数据 政策 方面 ,国内 已 有 青 秀 玲 老 
见 全 貌 。 由 此 ,又 造成 一 系列 的 问题 ,例如 :中 独立 存 师 翻 译 和 引 介 Christine L. Borgman MARIA 
在 的 数据 集 如 何 证 明 普遍 适用 的 科学 理论 命题 ;@O 除 著名 信息 搜寻 行为 研究 者 Gary Marchionin 在 武汉 大 


7 少数 的 圈 内 人 十 ,一般 民 众 或 者 其 它 科研 社 群 只 能 。 学 介绍 iSchool 的 科研 数据 管理 经 验 "" 、 著 名 华人 学 
选择 “相信 ”或 者 “不 相信 " 某 项 科学 论述 ,而 无 法 亲 者 秦 键 在 国家 科学 图 书馆 进行 专题 


; RU) 、 黄 永 文 老 
检验 它 ;四 假若 选择 相信 , 但 是 缺乏 数据 ,人 们 并 不 


LEE 师 等 人 介绍 国家 科学 图 书馆 调研 的 开放 科学 数据 政 
接应 用 这 项 科研 成 果 ;@ 即 使 人 们 能 够 通过 各 种 途 策 、 科 学 数据 引用 格式 以 及 仓储 案例 等 "1, 以 及 孟 祥 
径 最 终 取得 这 些 数 据 , 许 多 数据 并 不 能 够 被 人 们 所 解 保 和 钱 鹏 老师 等 系统 梳理 国外 数据 教育 的 作法 0 等。 
读 ;@@ 即 使 能 够 解读 ,数据 不 一 定 是 可 以 重复 使 用 的 这 些 成 果 是 科研 数据 权益 管理 的 重要 基础 。 
格式 ;@ 即 使 人 们 取得 可 以 解读 并 且 重 用 的 数据 , 不 据 此 ,本 文 提 出 科研 数据 管 


iE ANB 个 主要 A] [u] : 


定 被 授权 使 用 ;@ 在 某 些 学 科 领 域 已 经 具有 存储 科 科研 成 果 的 数字 数据 长 期 保存 (Preservation) #0 ® & 
研 数据 的 系统 平台 ,但 是 记载 科学 论述 的 论文 和 存储 过 程 中 的 数字 数据 管理 (Curation) 。 前 者 主要 是 将 已 
科研 数据 的 地 点 并 不 一 定 相同 ,不 一 定 提供 方便 可 靠 ”经 发 表 在 学 术 期 刊 上 的 论文 或 者 已 经 出 版 的 专著 中 ， 
的 链接 ;@ 潜 在 的 跨 学 科研 究 所 需 的 科学 数据 以 不 后 所 涉及 的 数据 分 析 的 数据 集 , 也 以 描述 、 存 储 和 提供 
格式 、 方 式 和 规范 存储 在 不 同 地 点 ;@ 而 且 , 在 目前 ， 下 载 与 使 用 ;后 者 主要 是 将 个 人 、 团 体 、 机 构 或 者 受到 
缺乏 科研 数据 所 产 出 的 问题 是 普遍 性 的 ,而 提供 科 资助 的 科研 项 目 所 产生 的 各 种 数据 ,在 不 同 阶段 中 的 
数据 促进 学 科 发 展 的 作法 则 是 个 别 性 的 ;@ 由 于 存在 各 种 处 理 的 数据 ,从 原始 采集 的 观察 数据 ,到 汇总 数 
F 述 种 种 困难 ,使 得 新 近 科 研 人 员 容易 误 入 歧途 , 忽 。 E ERAGE KDB WR RRB RR RIA 


ES 
BAG SE SRA 24 IINE REL 24 SH, ORFA 可 以 分 析 的 数据 集 , 以 及 最 终 经 过 整理 的 数据 \ 简 化 
数据 管理 过 于 倾向 信息 系统 化 和 既定 的 学 科 范 式 后 得 以 发 表 的 数据 等 , 均 予 以 存储 ， 提供 得 以 后 
,反而 容易 加 深 自 我 封闭 的 倾向 ;科研 贡献 评价 续 分 析 利 用 的 元 数据 说 明 、 分 析 工 具 说 明 、 分 析 结 果 
衡 ;科学 思想 的 影响 被 放大 ,而 科学 求证 的 贡献 被 说 明 等 的 一 系列 文件 。 采 用 第 一 种 管理 机 制 ,需要 考 
古 , 而 恰恰 两 者 是 相辅相成 的 。 虑 :个 科研 数据 的 层级 和 @@ 科 研 数据 的 表述 结构 ; 而 

科研 数据 之 于 图 书馆 事业 ,并 不 只 是 “又 一 项 要 采用 第 二 种 管理 机 制 ,需要 考虑 和 @ 之 外 ,还 需要 
准备 处 理 的 信息 资源 "或 者 “又 一 种 可 以 拿 来 用 的 情 考虑 到 @@ 科 研 数 据 的 生命 周期 。 
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Basic Framework of the Analysis on Research Data Rights 


顾 立 平 


W LOIRE SL MET vr LOC 


3 ”科研 数据 的 基本 概念 注意 到 科学 自身 如 何在 上 个 世纪 末 从 实证 主义 型 
究 转 向 数据 密集 型 研究 “科学 传播 ,包括 同行 评审 ， 
也 在 发 生根 本 性 的 变化 。 费用 、 时 效 、 以 及 把 实 
验 数 据 和 有 关 文 件 放 在 一 起 的 需求 ,公共 数字 图 书 
全 面 蔡 换 传统 图 书馆 收藏 出 版 物 的 角色 ” 

据 的 层级 " ,如 表 1 所 示 。 在 实证 主义 型 研究 的 
代 , 只 能 从 原始 数据 提炼 为 推导 和 组 合 数据 ,再 形 
科学 文献 内 容 , 而 在 数据 密集 型 研究 时 代 , 人们 可 以 
从 科学 文献 链接 到 组 合 数 据 , 并 且 从 组 合 数 据 发 现 原 
始 数据 ,进行 数据 之 间 的 汇流 与 挖掘 。 


科研 数据 作为 一 种 知识 资产 ,既是 "知识 工业 "的 
“原料 "和" 成品 " ,也 是 知识 型 社会 中 人 们 得 以 “证 明 ” 
和 "影响 "他 人 对 自身 评价 的 资产 , 它 的 存储 和 传 
方式 已 对 知识 型 社会 的 组 成 产生 影响 。 人 类 “ 社 
会 "这 个 概念 正在 改变 ,从 工业 模型 到 知识 模型 的 转 
变 , 最 主要 的 因素 是 原料 质变 ,也 就 是 数据 和 信息 交 
流 方 式 的 改变 "5 。 科 技 发 展 驱动 社会 变迁 的 其 
项 影响 即 是 传播 方式 的 转变 ,不 仅 是 在 人 群 之 中 ,也 
在 科技 研究 的 自身 发 展 方式 变化 中 。 在 《第 四 范式 
数据 密集 型 科研 探索 》 这 部 网 路 开放 的 著作 中 ,特别 


TN 


Ir 
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表 1 科研 数据 的 层级 


层级 定义 
文献 Literature 从 数据 分 析 得 到 科学 论点 的 数据 
推导 和 组 合 数 据 Derived and Recombined Data 经 过 处 理 能 够 被 用 来 计算 的 数据 
原始 数据 Raw Data 从 现实 世界 观察 记录 而 来 的 数据 


在 数据 密集 型 科研 下 ,需要 重新 看 待 知识 结构 的 者 将 数据 进行 挖掘 的 信息 工作 ,是 人 们 推进 开放 科学 
关系 ,回归 康德 ,界定 科学 '” 。 如 表 2 所 示 , 事 实 或 者 的 主要 工作 ,也 是 最 后 促成 知识 (知识 ,在 此 是 指 , 人 类 
数据 是 科研 工作 的 根本 基础 ,在 事实 以 外 或 者 缺乏 数 行为 准则 和 自然 变化 规律 ) 产 出 的 重要 过 程 。 因 为 科 
据 佐 证 的 情况 下 ,人 们 无 法 进行 科研 成 果 验 证 的 情况 研 数 据 的 重要 性 透 过 新 型 科学 研究 技术 而 被 放大 ,所 
,无 法 成 立 科 学 结果 与 论点 。 而 对 事实 进行 观察 或 以 科研 数据 管理 的 工作 ,也 成 为 一 项 重要 的 基础 建设 。 


表 2 知识 结构 


知识 结构 康德 之 问 (Immanuel Kant) 经 典 著作 
事实 /数据 我 能 知道 什么 Was kann Ich wissen? 《纯粹 理性 批判 》( 1781) 
信息 我 能 期 待 什么 Was darf Ich hoffen? 《判断 力 批判 》(1790,1793) 
知识 我 应 该 做 什么 Was soll Ich tuen? 《实践 理性 批判 》( 1788) 
当前 正在 快速 推进 的 开放 获取 、 开 放 知 识 、 未 来 的 科研 数据 的 分 析 基 础 。 表 1 外表 3 是 图 书馆 掌 


屋 科 研 数据 的 重要 基础 ,此 外 ,也 是 分 析 科 研 数据 权 
i EBA SH o 


创新 三 科技 信息 交流 体系 变化 ,为 PIEZ NI 
更 多 挑战 和 提出 更 高 要 求 “。 图 书馆 作为 社 


ES 


p 
a NR ke od 


* om; 


础 设施 对 新 兴 技 术 而 言 , 既 要 作为 公共 知识 供 
基础 大 enc AM R3 ”科研 成 果 与 科研 数据 的 表述 结构 
服 SEG, 要 成 为 A Tis G3 投入 施放 的 表 ;、 < 
NEM irs ` 定义 例子 

合 。 科 研 数据 管理 是 图 书馆 发 展 的 新 兴 机 遇 ,图 书馆 参照 物 | 记载 科研 成 果 的 实体 书 

对 科研 数据 的 发 现 、 评 价 与 直选 的 能 力 ,以 及 描述 、 组 标识 符 | 指向 参照 物 的 符号 ISBN 

织 、 检 索 或 者 分 析 科研 数据 的 能 力 , 在 未 来 至 关 重 要 。 | Tet eae 
& 书号 

表 3 既是 表述 科学 出 版 物 的 结构 ,也 是 表述 科研 数 

据 以 建立 数据 元 数据 的 重要 内 容 *" , 它 既 是 图 书馆 理 科研 数据 权益 管理 是 科研 数据 服务 是 否 可 持续 

论 与 实务 中 的 FRBR 和 RDF 等 框架 的 设计 基础 ,也 是 发 展 重点 。 短 期 来 看 ,科研 数据 管理 可 以 透 过 大 型 云 
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mea 数据 库 建立 ,但 是 长 期 来 看 ,科研 数 根据 DCC 的 数据 管理 计划 ,实施 流程 包括 六 个 阶 
据 服 务 的 营运 与 法 规 、 技 术 财务 和 组 织 “ 下 的 管理 、 段 

需求 .开放 成 本 政策 的 支撑 力度 有 关 ': 。 所 以 , 科 (1) 创建 数据 的 实施 方案 :的 设计 研究 、 计 划 数 据 
学 数据 权益 管理 框架 的 用 途 , 在 于 能 够 按 图 索 双 , 在 FEUER, TEE) AST KAWAI 
实践 过 程 中 ,不 断 改 善 和 深化 相应 的 内 容 。 数据 (实验 数据 、 观 察 数据 、 测 量 数 据 、 模 拟 数据 )、 捕 

数据 政策 对 科学 家 们 以 及 它们 如 何 持 有 科研 数 获 和 创建 元 数据 。 

据 等 产生 影响 ,而 且 来 自 资助 机 构 和 期 刊 的 建议 和 强 (2) 数 据 处 理 的 记录 内 容 :数据 汇 整 (输入 数字 
制 执行 会 有 更 大 的 影响 。 数 据 政策 要 求 接受 资助 者 KER OE) 数据 清洗 (检查 验证、 清理 数据 )、 匿 


以 及 论文 作者 ,确保 作为 出 版 前 提 的 或 者 在 项 目 中 产 名 化 数据 \ 描 述 数据 管理 和 存储 数据 。 
生 的 数据 可 获取 性 5 。 科 研 数据 具有 三 种 存储 、 传 (3) 分 析 数据 的 文件 化 过 程 ; 解释 数据 .导出 数 
播 、 引 用 和 发 布 的 形式 ,整理 如 表 4 所 示 。 据 、 产 生 的 研究 成 果 、 作 者 文章 、 准 备 保存 的 数据 。 
(4) 保 存 数据 的 说 明 信 息 :数据 迁移 到 最 好 的 格 
和 式 .数据 迁移 到 合适 的 媒介 、 备 份 和 数据 存储 、 创 建 元 


RAMBO 
三 种 情况 定义 


数据 和 文件 、 数 据 归 档 。 
(5) Fla) Z4 居 政 策 声明 ;分 发 数 居 、 共 享 数据 、 控 

制 访问 、 建 立 著 作 权 与 许可 证 、 推 广 数 据 ( 主 要 应 用 在 
需 


a EE uia 此 类 情况 又 称 数据 论文 DigitalCuration 的 工作 ,在 Digital Preservation 则 无 需 
为 数据 扩散 而 实施 执行 工作 ) 。 
科研 数据 依附 出 版 作为 注释 文本 内 容 的 材料 ,以 丰富 出 z TE ya Es 
物 发 表 PUES ^ a pde 文件 (6) 重 用 数据 的 途径 与 许可 范围 :后 续 研 究 、 新 的 
得 以 发 表 ( "使 得 出 版 物 丰 富 化 uocem Aera 四 
- P 研究 、 进 行 研究 评论 、 审 议 结果 、 教 育 与 学 习 。 


然而 ， 在 上 述 AY SL 数 导管 里 流程 ,涉及 至 少 
如 表 5 所 示 。 在 科研 数 
和 保护 这 项 具有 不 同 的 


科研 方法 和 不 同学 科 中 的 科研 对 象 的 特征 , 人们 m Sts 
对 科研 数据 会 有 不 同 的 认识 。 科 研 数据 的 概念 检验 ， "tm 


" " N s s 导管 的 大 施 过 下 5 HJ BE 
必需 服务 不 同学 院 和 学 术 社 群 以 及 符合 它们 对 科研 Fes. A 
数据 概念 的 认识 ER 础 设施 的 同样 来 权利 与 利益 的 参与 者 和 权益 者 。 
A* HY VWNVLAo DI, 16 AME J "ms AK [E TSK | _ 
aa ee 其 中 ,科研 人 员 上 比较 顾虑 科研 数据 作为 一 种 科学 
内 容 和 用 户 需 求 。 


为 科研 过 程 的 一 部 分 或 者 结果 的 数字 数据 , 科 PORABE MAASI i ni 
斌 数据 出 现在 科研 活动 中 的 所 有 阶段 里 ,从 科研 数据 。 O MARNMRANARREAARRKE R 
生成 到 科研 结果 产 出 ,包括 科学 、 社 会 科学 实证 研究 。 ”个 所 使 用 、 重 央 和 闪 验 科学 理论 。 科 研 机 构 
或 是 文化 现象 观察 等 。 为 此 ,需要 考察 中 利益 关系 人 “并 ” 王 科研 数 据 作为 一 种 机 构 知 识 资产 的 保存 和 
‘Slekcholiens) Ones MEONMGE Rae, TIN SETAE RM MALAI, AHH 
bises A Ca] 往 重视 科研 数据 作为 科研 项 目 成 果 的 一 个 部 分 ,无 
如 何不 能 沦 为 以 私人 所 有 的 方式 挪 作 他 用 ,或 者 宁可 
4 SRS RE A A RA 放 共享 以 增加 资助 机 构 在 行业 中 的 公信 力 。 出 版 
在 科研 数据 权益 管理 政策 中 的 具体 措施 ,包括 创 商 经 常 关心 以 什么 手段 可 以 取得 合理 的 商业 利润 ,使 
建 数 据 、 数 据 处 理 、 分 析 数 据 、 保 存 数 据 、 访 问 数 据 、 重 得 能 够 开发 更 好 地 科研 数据 服务 。 公 众 则 关心 是 否 
数据 等 一 系列 科研 数据 管理 工作 流程 中 所 需要 的 接近 、 使 用 科研 数据 的 权利 ,以 及 知晓 科研 结果 是 
实施 方案 .记录 规范 文件 化 方式 附加 说 明 信 息 、 传 


播 政 策 声 明 与 许可 证 制度 等 。 
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表 5 科研 数据 的 参与 者 和 权益 者 


利益 相关 方 科研 数据 的 参与 者 
科研 人 员 (Researchers) ed and Engineer) 
学 术 社 群 (Scholar Community) (39? e ( Ee 
WU (Institution) 31 m a UNE 
研究 资助 者 (Research Funder) 3? m X112 你 Vues. pir 
V Publier T ee De 
AA (Public) 39) Ae EK etal Groups) 


5 ”科研 活动 中 的 数据 权益 问题 据 处 理 态度 的 关键 因素 是 他 们 所 在 的 社会 网 络 与 行 
社会 资本 (此 处 指 :预期 互惠 ) 与 科研 社 群 对 科研 qr 学 科 的 科研 数据 共享 需求 .文化 

数据 开放 共享 的 行为 方式 有 关 , 科研 人 员 之 间 的 竞争 TOE RATE BENK EMT. 

关系 只 是 中 等 影响 因素 ,真正 决定 科研 人 员 对 科研 数 


al 


表 6 不 同学 科 的 科研 数据 权益 问题 


学 科 EY 权益 问题 
生命 | 可 公开 访问 的 SNP 数据 库 (干细胞 研究 ) ,允许 个 | 以 目前 的 技术 保障 措施 ,不 能 完全 保护 捐助 者 的 身份 资料 ,所 以 国际 
| 体 识别 的 新 方法 和 相关 工具 的 应 干细胞 论坛 (ISCF 3275 " SNP. 人 类 胚胎 干细胞 的 出 版 政策 声明 ” 
声学 | 全 球 海洋 观测 [39 部 分 地 区 只 音 影响 海洋 生物 的 生存 ,正在 建立 数据 采集 、 共 享 和 建 术 
化 学 软件 之 间 的 互 操作 性 、 开 放 源 码 开发 人 员 的 合作 ,化 学 研究 社 群 


BA dq pee [37] a US es NE. 
化 学 | 蓝 方 尖塔 (Blue Obelisk) iz z3) 4 资源 和 开放 标准 


的 
医药 | IMEX 联盟 的 的 分 子 数据 交换 原则 [38-40] 数据 质量 、 化 学 生物 学 与 药物 发 现 的 应 
基因 | 剑桥 大 学 CrystalEye 项 目 [41-42] 晶体 结构 数据 的 结构 化 XML 的 开放 数据 ,提供 浏览 搜索 和 新 知 快报 
aR | 心脏 影像 和 临床 数据 的 大 型 数据 库 (atlases)'43-4] | 根据 Mozilla 公共 许可 协议 版 本 1.1 提供 开源 软件 


nm 


不 同学 科 的 科研 数据 权益 问题 ,环绕 在 两 条 主线 下 的 具体 实施 作法 , 则 是 依赖 在 不 同 的 科研 层级 之 
上 ,一 是 在 "最 大 程度 地 利用 数据 "和 "最 大 程度 地 保 数据 管理 政策 。 这 类 政策 包括 重要 但 是 经 
护 安 全 隐私 "之 间 的 平衡 问题 ,这 项 挑战 需要 以 发 民 常 为 人 们 所 忽视 的 权益 界定 和 处 理 准 则 ,这 些 涉及 各 

子 信息 管理 的 蔡 代 方 案 ” 在 不 同学 科 中 进行 解决 ; 方 权益 的 政策 ,指引 着 利益 关系 人 (Stakeholders) 在 保 


} | 


二 是 在 "数据 共享 "和 "数据 获取 "之 间 的 权利 义务 关 存 、 发 布 、 使 用 和 传播 科研 数据 时 ,应 该 共同 遵循 的 各 
系 ” 。 前 者 涉及 科研 人 员 与 一 般 人 群 之 间 , 需 要 科研 ”项 原则 。 

数据 权益 方面 的 基本 权利 保障 机 制 ,后 者 涉及 科研 人 6 科研 数据 权益 的 管理 层级 

员 与 科研 人 员 之 间 , 需 要 科研 数据 权益 方面 的 合作 协 科研 数据 权益 管理 的 层级 ,分 为 ,国际 .国家 .机 
调 规范 政策 。 


构 、 个 人 。 如 表 7 所 示 5 ,不同 层级 关心 以 及 能 够 进 
行 的 内 容 , 有 所 差别 。 


前 ,上 述 这 种 争论 已 经 日 益 获 得 各 种 共识 , 基 
本 原则 是 斗 研 数据 的 放 共 E ,但 是 f£ ^ 可 条 件 和 人情 


Arthik 


DOCUMENTATION , INFORMATION & KNOWLEDGE 


R7 科研 数据 权益 管理 的 层级 (参考 ) 


层次 | WR 案例 
第 1 层 | 全 球 合作 项 目的 国际 案例 大 型 粒子 对 撞 机 、 全 球 蛋 白质 数据 银行 
第 2 层 | 数据 中 心 .国家 机 构 英国 研究 理事 会 、 惠 康 基 金 会 
第 3 层 | 个 别 机 构 、 大 学 和 研究 机 构 保存 研究 计划 所 产生 的 数据 (彼此 之 间 的 差异 很 大 ) 
第 4 层 | 研究 小 组 或 者 个 别 研究 人 员 在 传统 的 、 现 成 工具 的 、 小 范围 内 里 提交 如 Excel 或 MATLAB 等 数据 
前 ,在 不 同 的 权益 管理 层级 中 ,出 现 各 种 出 于 ” 题 、 成 为 可 理解 可 操作 的 数据 .具有 足够 的 透明 度 和 


\ 同 目的 而 产生 的 数据 政策 。 例 如 :欧洲 议会 和 欧盟 清晰 度 ,以 及 支持 用 户 互 动 与 访问 。 科 研 数据 权益 
理事 会 启动 的 政府 开放 数据 运动 ,主要 根据 W3C 的 管理 必需 在 技术 、 财 务 、 法 规 和 组 织 能 力 上 ,解决 这 些 
数据 描述 建议 ,提供 政府 数据 的 访问 方法 ,这 个 项 问题 。 
包括 开放 数据 的 结构 与 格式 .可 以 被 重用 的 数据 , 以 先 , 在 四 十 年 前 发 表 一 篇 论文 需要 包括 完整 的 
及 提供 给 公民 和 企业 新 服务 "等 ,属于 框架 性 质 。 英 数据 以 提供 重复 操作 ,然而 鲜 有 期 刊 可 以 这 么 做 到 ， 
到 地 形 测量 局 的 OS Open Data 在 线 地 图 门户 网 站 ,多 习 为 新 的 科技 研究 所 需 的 大 量 数据 远 非 期 刊 能 够 刊 
F 览 、 下 载 或 者 开发 简单 的 数据 应 用 , 促进 和 载 。 这 使 得 科学 成 果 的 两 个 主要 部 分 :思路 和 证 据 ， 
励 更 多 地 理 信息 数据 注入 入 ,强化 政府 对 支离破碎 被 分 开 来 ,形成 了 一 道 数据 鸿沟 (data-gap) ,不 利于 科 
理 位 置 (特别 是 边缘 岛屿 与 海 权 领地 等 ) 的 信息 学 的 自我 审查 机 制 。 试 问 : 如 果 不 能 访问 和 评论 科 
,属于 国家 政策 。 美 国 健康 保险 流通 与 8 么 如 何 挑战 和 修正 科学 理论 呢 ? 


= 


ZB 


f Z [47-48] Age 
EH sj 
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王 法 案 (HIPAA) 的 隐私 规则 的 要 求 ,开放 数据 的 管理 要 解决 这 个 问题 ,并 且 能 够 产生 在 数据 密集 型 科 
技术 必需 采用 模拟 攻击 和 匹配 试验 的 风险 识别 ,经 过 研 中 的 科学 加 速 进步 的 效益 ,需要 科研 数据 的 开放 共 
鉴定 ,能 够 实现 开放 数据 的 建立 原则 "后 才能 实现 ， 享 。 表 8 显示 了 科研 数据 开放 共享 的 程度 。 只 有 在 
盟 于 行业 内 的 技术 细节 。 而 化 学 信息 学 工具 ,对 分 析 可 访问 性 、 可 评估 性 、 可 解读 性 、 可 使 用 性 等 四 个 条 件 
化 学 生物 化 学 药理 学 和 药物 发 现 等 的 应 用 :5 , 则 属 都 具备 的 情况 下 , 科研 数据 能 够 被 重复 验证 ,以 及 据 
研究 团队 的 项 作 。 此 形成 科学 探索 与 发 现 的 新 知识 。 
最 近 , 国 际 间 的 科研 管理 政策 , 具 朝向 科 
研 数 据 开 放 共 享 的 趋势 ,例如 .欧盟 成 员 国 有 政策 实 表 8 科研 数据 开放 共享 的 程度 (参考 ) 
施 * 公 共 资 金 资助 科研 成 果 的 科研 数据 通过 电子 基础 L7? s — 
设施 实现 公共 获取 、 使 用 和 重用 "sl。 美 国 白宫 科技 accessible 可 访问 性 EP OE CROPS, (7 
LAD AS (OSTP) 的 行政 命令 是 无 论 全 部 或 者 部 accessable 可 评 们 性 人 可 
分 受到 联邦 资助 的 科研 项 目 , 所 产生 的 数字 形式 的 科 
研 数据 应 该 进行 存储 ,并 且 提 供 得 以 搜索 .检索 和 使 | ntelligible 可 解读 性 。 | BE PREM MERAM, Ge 
的 公开 获取 "。 欧 盟 计 划 在 第 八 次 HORIZON useable TI 4 FA te Des ae RES ARES 
2020 框架 中 加 入 类 似 要 求 *”1。 这 些 政策 在 很 大 程度 — 
FEAT ee ie UR epe an 若 将 科学 论文 与 支持 论文 结果 的 实际 数据 和 元 
而 ,具体 如 何 进行 , 则 涉及 到 一 系列 诸如 :使 用 权益 与 数据 紧密 集成 , 则 意味 在 论文 .数据 .元 数据 (描述 论 


> 
la FR MAA KE A CAMA AALS ME hfe "o" 
引用 问题 ,存储 权益 和 采集 问题 、f X a E A dp [o] 文 与 数据 ) 以 及 链接 上 ,进行 有 效 而 且 长 期 维护 的 能 


Bi |. E 2c = K mp m as T 2 x 
média RdMn Haus 力 。 这 类 科研 数据 的 特殊 要 求 ,有 别 与 传统 期 刊 元 数 
7 科研 数据 权益 管理 的 使 用 权益 与 引用 问题 据 和 文摘 的 工作 流程 。 目 前 ,国际 晶体 学 联盟 (Inter- 

数据 资源 的 可 用 性 (usability) 包 括 :反应 具体 问 national Union of Crystallography, IUCr) 的 学 术 期 刊 ,已 
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经 进行 若干 尝试 , 它 将 科学 论文 与 实验 数据 的 元 数据 年 12 月 共同 成 立 DataCite 为 一 项 目标 而 努力 ;让 科 
SM) ,提供 短篇 结构 文章 、 实 际 数据 文档 、 含 有 讨论 学 家 在 互联 网 上 访问 科研 数据 、 接 受 科 研 数据 作为 独 
的 文本 批注 、 传 输 中 介 以 及 工具 等 ,从 而 可 以 便利 地 立 而 且 受 到 引用 的 科研 对 象 ,以 及 确保 良好 的 科学 实 
创作 和 创建 交互 式 分 子 图 形 等 服务 。 践 规则 31。 它 的 三 项 主要 工作 ,包括 1 : 

另 一 方面 ,如 果 要 求 科 研 人 员 提 供 数 据 ,那么 必 (1) 作 为 数字 资源 唯一 标识 符 (DOI) 的 官方 注册 
需 保障 他 的 权益 :保障 科研 人 员 提 供 科 研 数 据 也 作为 机 构 。 

科研 产 出 的 贡献 。 如 同期 刊 论文 无 论 是 放 在 何 (2) 积 极 发 展 标 准 规范 、 最 佳 实践 交流 ,以 及 制定 
种 平台 , 均 能 按照 刊 名 、 卷 期 \ 页 数 、 署 名 等 被 引用 或 作 流程 。 
者 证 明 其 工作 成 果 一 样 ,科研 数据 也 需要 能 够 被 3 (3) 建 立 可 供 访问 的 中 央 元 数据 库 , 实 施 开放 共 
和 被 识别 的 机 制 。 享 。 人 们 可 以 通过 第 三 方 (如 WOS) 进 入 这 个 数据 库 ， 

科研 数据 的 引用 方式 有 两 种 取向 ， 是 注册 单 免费 使 的 内 容 。 


b 
SH 
oy 
p! 


f 8 
一 数据 集 , 即 赋予 每 个 数据 集 一 个 可 以 标示 符号 ,f ,在 基本 权利 上 ,保障 科研 数据 在 科学 
来 源 ; 另 一 种 是 将 数据 集 作为 论文 的 一 种 附加 交流 体系 中 的 地 位 。 科 研 人 员 发 布 科研 数据 的 贡献 ， 
材料 。 得 到 承认 。 首 先 , 不同 程度 的 科研 产 出 的 科研 数据 
德国 科研 基金 会 DFG 的 “科研 数据 的 发 布 与 引 (SAR 1) ,作为 参照 物 ,具有 标识 符 和 元 数据 (参考 
"计划 曾经 以 DOI 域名 和 URNs 注册 的 基础 设施 来 表 3) ,能够 被 承认 和 引用 。 其 次 ,各 种 学 科 内 的 科 
处 理科 学 数据 ,作为 识别 符 的 DO 域名 应 用 ,可 以 链 数据 (参考 表 6) 能 够 据 此 形成 各 自 的 工作 流程 ,以 及 
交 一 篇 科学 论文 和 文章 中 所 分 析 的 科研 数据 5 。 文 逐步 形成 行业 规范 。 第 三 ,各 种 数据 银行 的 内 容 , 可 
章 和 数据 集 通 过 他 们 各 自 的 DOI 域名 ,能 够 共同 被 引 以 被 检索 和 使 用 。 最 后 ,不 同 层 级 的 科研 数据 (参考 
。 这 种 引用 和 链接 的 形式 提供 科研 数据 ,直接 指向 表 7) 均 能 纳入 这 个 权益 管理 制度 内 。 
科学 论文 ,也 就 是 supplementary data( 附加 数据 )。 范 8 科研 数据 的 存储 权益 和 采集 问题 
MEE 数据 管理 工作 流程 ALE REO! RE 


Kuhlmann, H. et al. (2009): Age models, iron 研 数 据 管理 工作 流程 *%1、 科 研 数 据 权益 管理 流程 ， 
intensity, magnetic susceptibility records and dry bulk 如 表 9 所 示 , 具 有 不 同 内 涵 。 
density of sediment cores from around the Canary 据 此 ,得 以 分 析 科 研 数据 管理 的 两 个 主要 面向 : 
Islands. 科研 成 果 的 数字 数据 长 期 保存 (Preservation) #0 # f 
PAMGEA，Bremen 过 程 中 的 数字 数据 管理 (Curation)。 前 者 主要 是 将 已 
doi: 10. 1594/PANGAEA. 727522 经 发 表 在 学 术 期 刊 上 的 论文 或 者 已 经 出 版 的 专著 中 ， 
指向 如 下 论文 ; 所 涉及 的 数据 分 析 的 数据 集 , 子 以 描述 、 存 储 和 提供 
Kuhlmann, Holger; Freudenthal, Tim; 下 载 与 使 用 ;后 i 要 是 将 个 人 、 团 体 、 机 构 或 者 受到 
Helmke, Peer; Meggers, Helge(2004): Reconstruc- 资助 的 科研 项 目 所 产生 的 各 种 数据 ,在 不 同 阶段 中 的 
tion of paleoceanography off NW Africa during the last 各 种 处 理 的 数据 ,从 原始 采集 的 观察 数据 ,到 汇总 数 
40,000 years: Influence of local and regional factors 据 、 检 验 数据 核实 数据 \ 剔除 以 及 保留 数据 转化 为 
on sediment accumulation. In: Marine Geology, 207 可 以 分 析 的 数据 集 , 以 及 最 终 经 过 整理 的 数据 、 简 化 
(1-4), 209-224 百 得 以 发 表 的 数据 等 , 均 了 予以 存储 ， 提供 得 以 后 
doi: 10. 1016/j. margeo. 2004. 03. 017 续 分 析 利 用 的 元 数据 说 明 、 分 析 工 具 说 明 、 分 析 结 果 


在 此 基础 上 ,众多 科技 图 书馆 和 信息 中 心 在 2009 说 明 等 的 一 系列 文件 。 
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表 9 科研 数据 权益 政策 的 概念 与 操作 化 定义 


科研 数据 流程 根据 信息 生命 周期 ,进行 采集 、 标 示 、 存 储 、 保 存 、 释 出 /使 用 、 别 除 等 
科研 工作 流程 根据 科研 工作 本 身 的 周期 性 工作 要 点 ,进行 记录 与 管理 
科研 数据 管理 工作 流程 根据 科研 工作 中 ,每 个 阶段 所 产生 的 数据 ,进行 各 种 不 同方 式 的 管理 
在 科研 数据 ; 流程 5 RH Lu 5 s 时 中 ,规范 与 协调 各 方 参与 
科研 数据 权益 管理 流程 者 与 利益 相关 221 在 冲突 ,使 得 科研 数据 管 作 流 程 的 记录 、 存 储 、 保 存 、 
AU xc todo 8 88 DÀ 顺利 运行 


参考 数据 档案 管理 的 生命 周期 ,以 及 表 7~9 个 维度 ;科学 数据 流 、 利 益 相 关 人 物 , 以 及 权益 管理 。 
的 内 容 , 制 定 x 10 ELA 数据 权益 管理 的 流程 ,分 为 = 


表 10 科研 数据 权益 管理 的 流程 
维度 标 任务 


管理 (格式 、 存 储 等 ) 
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续 表 10 
维度 标 任务 
B-6 企业 研究 资助 者 B-6-1 企业 投入 研究 
B-6-2 企业 委 外 研究 
B-7 政府 B-7-1 产业 部 门 
B-7-2 监督 部 门 
B. 利 益 关 系 人 
B-8 公众 B-8-1 个 人 
B-8-2 公众 团体 
"PS B-9-1 数据 采集 者 (Data originators) 
B-9 数据 生产 者 B-9-2 数据 提供 者 (Data providers) 
C-1 公共 知情 权利 
C-2 合法 商业 利益 
C-3 国家 安全 机 密 
C-4 个 人 隐私 权 
C-5 知情 同意 权 
: -6-1 可 访问 性 (accessible) 
C. 权 益 管理 $62 可 评价 性 (accessable) 
C-6 数据 开放 性 C-6-3 可 解读 性 (intlligible) 
C-6-4 可 使 用 性 (useable) 
C-6-5 可 操作 性 (executable) 
C-7-1 匿名 化 (Anonymisation) 
C-7 数据 保密 性 C-7-2 有 限 访问 (limited Access) 
C-7-3 封闭 化 (Closed) 

9 科研 数据 的 传播 权益 与 发 布 问题 Ho WR 11 所 示 , 包 括 一 系列 权益 管理 政策 ,未 来 可 
psp ANE. c "X = ip 预见 的 科研 数据 发 布 系统 , 宜 先 进 和 策 制 定 
sKR ubi Sx RE mEGüdanz POOPIE AT A Aes TAE EAT RIR M T E 

方 能 规划 系统 平台 的 存储 要 求 、 权 限 管理 和 传播 许可 


数据 紧密 集成 , 则 意味 在 论文 .数据 、 元 数据 (描述 论 A 
制度 等 。 
文 与 数据 ) 以 及 链接 上 ,进行 有 效 而 且 长 期 维护 的 能 “制度 等 


表 11 科研 数据 发 布 系统 的 数据 权益 管理 


科研 数据 发 布 系统 科研 数据 服务 的 功能 涉及 的 权益 管理 政策 

开放 数据 [@7] 提供 学 科 领 域内 的 数据 挖掘 与 知识 发 现 隐私 权 规 范 、 安 全 性 准则 

开放 系统 架构 [9] 是 供 不 同 设备 平台 软件 的 数据 交互 数字 著作 权 管理 (DRM) 

开放 关联 数据 [1 ”| 跨越 不 同 的 数据 源 ,获取 所 需 数 据 标准 协议 、 获 取 、 许 可 证 

开放 平台 [68] 是 供 数据 接口 ,对 接应 用 程式 界 数据 库 权 (DR) 与 创作 共用 

知识 元 库 [e8] 论文 与 论文 .论文 与 数据 ,数据 与 数据 许可 条 款 的 许可 证 编码 

数据 价值 计量 (91 | 科研 论文 与 数据 的 全 谱 段 使 用 统计 计 终端 用 户 的 使 用 记录 和 保密 

在 科研 数据 发 布 与 链接 服务 的 方向 上 ,有 两 大 重 ， 立 维护 和 更 新 他 们 各 自 的 数据 "" 。 将 开放 信息 转换 

要 技术 线路 :关联 开放 数据 和 知识 元 库 。 尽 管 技术 已 为 可 计算 的 开放 知识 ,有 关 工 作 包 括 ” :中 支持 开放 
经 成 熟 , 但 是 决定 是 否 能 够 实现 的 关键 因素 是 数据 权 ”化 信息 的 可 重用 ;支持 可 重用 信息 的 结构 化 ;@@ 支 
益 管理 。 持 结 构 化 信息 的 语义 化 ;加 支 持 语义 化 信息 的 关联 


(1) 关 联 开放 数据 与 传统 意义 上 的 搜索 不 同 , 它 化 。 关 联 开放 数据 (linked open data, LOD) 过 程 包括 . 
能 够 跨越 不 同 的 数据 源 , 在 诸如 RDF 格式 和 SPARQL 采集 数据 、 公 布 关联 数据 、 规 范 化 链接 中 的 “连接 点 ”、 
查询 语言 标准 的 基础 上 ,执行 复杂 查询 , 它 更 类 似 从 个 别 数据 集 获 得 数据 ,以 及 客户 端 应 用 程序 数据 
分 布 式 或 者 联合 数据 库 , 但 与 之 合作 的 数据 源 则 是 独 等 "3 一 系列 处 理 程 序 和 规则 。 然 而 ,开放 关联 数据 ， 
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LER P EDAD :开放 (标准 、 获 取 \ 许 可 ) 和 关联 ( 识 cal Expression Language) "i ,以 及 ,智慧 链接 各 种 科 
别 符 、 数 据 模型 .本体 、 查 询 语言 )。 研 数 据 中 心 的 数据 库 , 提 供 检索 、 访 问 、 下 载 与 计算 等 


(2) 知 识 元 库 (Knowledge base, KB) :受到 知识 元 功能 ,如 表 12 所 示 的 Altmetric 等 34 计算 使 用 数据 
库 开发 者 所 编译 、 分 发 、 维 护 的 庞大 数据 库 , 其 有 关 电 的 方式 。 目 部 ,知识 元 库 的 供应 链 是 系列 复杂 的 


了 资源 的 信息 ,例如 标题 列表 、 有 覆盖 日 期 \ 无 颖 链接 色 所 组 成 :出 版 商 、 其 他 内 容 持 有 者 、 订 阅 代 理 者 、 
等 ,早期 是 为 “动态 更 新 链接 ”i SAD ZA 链接 解析 器 供应 商 、 图 书馆 等 “” 。 美 国 NISO 正在 
接 ” "而 设计 ,后 为 解决 “适当 副本 (Appropriate cop- 足 进 新 的 标准 ,解决 数据 质量 和 许可 证 的 问题 ' 引 。 这 
y) ”问题 " 引 。 根 据 同样 原理 ,可 以 开发 学 科 内 用 于 数 些 问题 也 会 发 生 在 科研 数据 在 学 术 交 流体 系 中 的 传 
据 密 集 型 科学 的 知识 元 库 , 如 “生物 标识 语言 (Biologi- 播 制度 。 


表 12 在 Almetrics 的 五 种 ID SAO 


ID 标准 常见 的 数据 中 心 在 Altmetric 的 范例 
Altmetric article ID Altmetric http : //api. altmetric. com/v1/id/241939 
DOI. DataCite http : //api. altmetric. com/v1/doi/10. 1038/news. 2011.490 
PubMed ID PubMed http : //api. altmetric. com/v1/pmid/21148220 
arXiv ID. arXiv. org http : //api. altmetric. com/v1/arxiv/ 1108.2455 
ADS bibcode NASA Astrophysics Data System | http://api. altmetric. com/v1/ads/2012apphl. 100y3104b 


如 果 寻 找 专 业 技 术 供 应 商 ,能 够 迅速 搭建 平台 ， 现 开 放 的 众多 好 处 ,然而 其 挑战 是 ,各 个 组 件 都 受 至 
然而 ,根据 国外 研究 显示 ,一 般 ( 其 它 行业 的 ) 专 业 技 不 同 的 著作 权 或 者 知识 产权 许可 证 的 约束 ";: S dm, 
术 供 应 商 如 果 愿 意 提供 开放 平台 ,捍卫 其 知识 产权 的 无 论 是 否 建立 平台 ,建议 提前 准备 科研 数据 权益 管理 
方式 会 更 加 猛烈 1。 这 是 因为 目前 广泛 采用 的 软件 政策 的 内 容 制 定 。 表 13 显示 科研 数据 发 布 涉及 的 权 
密集 型 系统 是 一 个 开放 架构 (OA) 加 上 多 个 开放 API 益 关键 问题 。 
作为 开放 源码 软件 (OSS ) 的 部 件 或 组 件 ;其 优点 是 实 


表 13 科研 数据 发 布 的 重要 权益 概念 


术语 定义 PX 
技术 保护 措施 HILRIHUL GLAS d VERMA M, | 以 技术 手 也 限制 原本 不 应 或 者 不 被 允许 的 
(TPM) 920 KH ANS ARES! 限制 范围 ,从 而 获得 商业 利益 
数字 著 管 案 迁 移 jit Zax 认证 手段 ,ii 、 " 4 x xe 
| 的 


B3 EE Rese AME RE, es E 
数据 库 权 (DRJtssst) | RAHA RAM HME AIRA MESEI). 各 ;> 加 入 服务) 或 次 是 权利 ( 行 售 ENTE 
播放 术 ( 如 向 公众 传播 权 ) ,以 及 发 行 权 等 DEUM 8 


决 传 在 互联 网 上 所 面临 的 困难 (例如 ，| 在 网 上 作品 受 著作 权 法 规定 的 法 律 环境 (全 
创作 共用 (CCjtsse6l | 允许 非 商业 性 质 的 复制 和 传播 等 }。 不 过 ,创作 共用 协 | 如 ;实际 上 无 法 立法 明确 商业 目的 和 复制 生 
PS 议 是 不 可 撤销 的 ,也 就 是 创造 者 不 能 阻止 已 获得 CCL | 为 的 定义 ) ,与 社会 规范 和 期 望 (例如 ,用 户 
的 副本 流通 在 工作 环境 中 的 自由 活动 等 ) 时 有 冲突 
科学 创作 旨 在 消除 在 科技 创新 合作 中 ,不 必要 的 法 律 和 技术 壁 研究 人 员 之 间 的 数据 共享 ,在 信息 技术 
(SCC) (971 。 其 长 远 目标 是 简化 研究 过 程 中 出 版 .许可 和 获取 | 上 、 合 作 方 式 上 、 运 行 机 制 上 还 有 许多 困难 
10 “科研 数据 的 共享 权益 与 政策 问题 不 同 之 处 在 于 ,需要 更 简单 、 更 灵活 、 更 有 效 的 技术 ， 


科研 数据 管理 ,并 不 仅仅 是 分 布 式 网 路 系统 和 个 以 及 ,更 重要 的 是 ,有 ”个 技术 和 文化 适应 的 需求 。 
在 生命 科学 领域 中 ,关联 开放 数据 (LOD) 的 技术 问题 


性 化 权限 管理 的 问题 。 与 过 去 的 分 布 式 异 构 数 据 的 SEES 
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不 足以 影响 建设 以 数据 为 中 心 的 “大 生物 学 "学 科 ， 另 一 方面 “开放 科学 (Open science ) "在 科学 界 兴 
然而 ,在 异 构 数据 的 文化 上 缺乏 了 解 虽 :个 遵 循 一 种 起 ,意味 :除了 最 终 研究 成 品 之 外 ,研究 人 员 分 享 他 们 
数据 标准 ;@@ 科 学 家 共享 数据 ;名 激励 措施 等 的 问题 ， 在 研究 过 程 中 的 每 个 元 素 , 以 促进 研究 人 员 之 间 合 作 
使 得 相关 工作 的 进展 存在 无 形 障碍 。 为 了 使 研究 数 的 一 种 新 型 科研 方式 , 它 能 够 促使 科研 人 员 自 发 性 创 
据 的 充分 利用 ,生物 科学 社 群 开始 倡议 技术 和 奖励 机 建新 的 虚拟 合作 研究 。 然 而 ,在 高 成 本 的 研究 工 
E, 以 支持 互 操作 性 ,促进 开放 科学 与 文化 的 增长 等 。 具 以 及 仅 有 少量 研究 成 果 能 够 获 利 的 情况 下 ,在 生物 

强化 元 数据 标准 的 发 展 , 可 以 提高 数据 的 访问 ， 医学 研究 领域 内 的 知识 产权 (IP) 制 度 不 断 扩张 到 学 术 
但 是 更 重要 的 是 数据 权益 管理 的 部 分 ,例如 工作 流 圈 内 ,知识 商品 化 现象 显著 "…"”] 。 研 究 人 员 目 前 处 
据 重 现 性 、 所 捕获 的 数据 源 、 数 据 保存 和 复原 、 于 一 个 混合 “开放 科学 "和 “专利 制度 "的 体制 之 内 。 


rn 


程 、 数 E: 
5e AVA AAS RAJ [e] o 。 以 结构 生物 学 科学 界 往往 对 于 开放 科学 有 着 不 同 的 认识 ,例如 什么 
为 例 , 早 期 发 展 阶段 并 没有 维护 实验 数据 的 制度 , 然 是 重复 性 、 计 算 资源 、 科 学 荣誉 .数据 共享 、 成 果 共 享 、 
而 , 随 着 科研 问题 日 益 复 杂 化 ,目前 在 结构 生物 学 界 同行 评审 、 成 效 评估 等 的 含义 往往 模糊 不 清 ,从 而 需 
的 人 们 越 来 越 相 信 这 些 未 被 充分 保管 好 的 数据 ,对 于 要 广泛 的 意见 和 动机 调查 ,并 且 通 过 不 同 的 宣传 , 达 
个 大 分 子 结构 的 研究 都 具有 重要 的 参考 价值 到 凝聚 共识 和 达成 协议 "”。 这 些 工作 有 赖 专业 科技 
数据 被 存档 和 收集 起 来 ， 在 适当 时 机 发 布 ,是 信息 政策 研究 与 咨询 的 工作 小 组 推动 , 方 能 使 得 科 
放 科 学 的 重要 举措 ,这 涉及 到 科研 数据 的 保存 、 流 通 、 人 员 更 容易 获得 学 术 信 息 交 流 的 便利 服务 ,以 及 最 好 
管理 、 保 障 等 一 系列 的 政策 问题 。 地 从 中 受益 。 科 研 数据 权益 与 政策 见 表 14。 


表 14 科研 数据 权益 政策 工作 2 


科学 家 传播 所 收集 和 建 模 的 数据 并 且 使 其 和 开放 获取 
大 学 和 科研 机 构 在 支持 开放 数据 的 文化 中 扮演 重 色 
评估 大 学 研究 ,注重 对 出 版 物 的 开放 数据 进展 ,建立 评价 
学 会 .科研 和 专业 团体 促使 成 员 成 为 开放 科学 的 先驱 者 
研究 理事 会 和 慈善 机 构 资助 的 项 目 应 提升 科研 数据 的 交流 

科学 期 刊 加 强 要 求 支 持 文 章 论点 信息 的 可 访问 、 可 评估 、 可 使 用 和 可 追溯 
工业 和 监管 部 门 共同 确保 公众 利益 的 数据 、 信 息 、 知 识 共享 
政府 重视 开放 数据 和 开放 科学 提升 卓越 科学 基础 的 潜力 
数据 集 在 一 种 按 比例 治理 的 体系 内 管理 ;具有 高 度 公共 价值 的 研究 潜力 的 情况 下 ,个 人 数据 才能 被 共享 
基于 现 有 商业 标准 调整 更 加 宽泛 的 信息 共享 协议 和 实践 
开放 性 在 法 律 保护 商业 价值 .隐私 安全 和 保密 的 范围 内 
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11 我 国 实施 科研 数据 权益 管理 的 需求 施 科研 数据 管理 时 ,有 其 权益 政策 的 服务 需求 。 
数字 科研 数据 因为 学 科 和 方法 而 有 不 同 的 数据 Mo liia La d 
X2 RHEESAGESUG. Reg  RCRMERC AMA RE UE BESOERESSMI 
58 的 获 目 的 而 假 tz TH EME SR 13, 右 规范 ,正在 朝向 科研 数据 放 共 享 的 权益 平 
内 容 和 工具 如 何 创造 、 存 储 、 调 整 和 分 析 的 合适 文件 ， 。 澳 方 向 发 展 中 。 而 图 书馆 在 科研 数据 管理 的 服务 
、 发 方面 ,正在 处 于 第 一 阶段 和 第 二 阶段 的 过 渡 时 期 ， 
,经 认识 到 科研 团队 对 于 图 书馆 协助 他 们 进行 
数据 管理 的 服务 需求 ,以 及 从 图 书馆 发 展 战略 的 角度 
上 


SH 


许多 科研 数据 管理 、 科 研 数 

研 数据 管理 服务 教育 的 措施 。 鉴 
往 知 来 ,从 中 国 科研 数据 管理 的 三 个 阶段 ( 表 15) 以 及 
司 图 书馆 界 的 发 展 阶段 ( 表 16) 的 梗概 ,可 以 得 知 实 
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表 15 中 国 科研 数据 管理 的 三 个 阶段 


时 间 TER 代表 事件 
mU 科研 数据 的 交流 和 管理 阶段 1984 中 科 院 牵头 组 织 * 中 国 CODATA 委员 会 


(20b1- pia) | 科研 数据 仓储 的 建设 与 数据 质量 控制 阶段 。。 | 2010 科技 部 “国家 科学 数据 中 心 网 " 


Pons 科研 数据 开放 共享 的 权益 管理 阶段 ee 国 创 新 大 会 上 深化 科技 体制 改革 的 相 
X16 中国 图 书馆 界 的 科研 数据 管理 服务 阶段 
时 间 ts 具体 行动 
第 一 阶段 | 在 数字 文献 管理 的 基础 上 ,拓展 为 科研 数据 管理 司 家 图 书馆 参与 文化 部 “国家 文化 数字 网 "项 
第 二 阶段 | 协助 科研 团队 实行 科研 数据 管理 的 仓储 建设 与 咨询 服务 CALIS 的 “高 校 科 学 数据 管理 机 制 及 管理 平台 研究 ”项 
第 三 阶段 | 成 为 科研 团队 的 科研 数据 开放 共享 的 主 撑 机 制 (目前 处 于 第 一 和 第 二 阶段 ) 
在 全 球 科 研 数据 政策 的 调研 基础 上 ,绘制 科研 数 据 权益 管理 的 政策 图 谱 , 如 图 1 所 示 。 
全 球 学 术 社 群 的 数据 共享 
数据 生命 周期 国家 政府 开放 数据 的 政策 
助 机 构 的 项 目 数据 要 求 
昱 研 机 构 的 数据 管理 要 求 
科研 生命 周期 ARES E: E A SHS Ah 
科研 人 员 的 数字 数据 素养 
图 1 科研 数据 权益 管理 的 政策 层级 
全 球 学 术 社 群 和 国家 政府 所 提供 的 政策 文件 , 主 上 出 现 较 多 。 所 以 ,进一步 搜索 已 经 实施 若干 时 间 、 
要 提供 原则 性 的 指导 意见 ;然而 ,具体 实施 细节 ,以 资 A 定 公 信 力 的 机 构 的 综合 报告 ,将 这 些 报告 的 内 
助 机 构 、 科 研 机 构 、 项 目 小 组 .科研 人 员 的 政策 和 手册 容 细 分 为 主要 内 容 架 构 , 整 理 如 表 17 所 示 。 


表 17 科研 数据 权益 政策 的 分 析 框 架 
政策 文件 类 型 主要 内 容 架构 


《资助 机 构 的 项 目 数据 要 求 分 析 框架 ) | UAB RIES SRR TE MASE LAR fe BORE Bt 
机 
3 


《科研 机 构 的 科研 数 ges 384) A AE 22) Eom ou TRIPS OHNE QN 
* a 项 目 名 称 、 学 科 领 域 .行业 规范 (学术 社 群 .国家 、 国 际 )、 资 助 者 、 项 
《项 目 小 组 的 数据 处 理 原则 分 析 框架 》 | Bie doce ei Misit eo o ROI HOA RS 
机 构 政 策 、 科 研 领域 的 伦理 规范 、 部 门 政策 、 开 放 获 取 原 则 、 发 布 科 
《科研 人 员 的 科研 数据 素质 分 析 框 架 》 | 研 成 果 的 需求 、 出 版 社 的 要 求 、 与 其 他 项 目 签订 的 数据 共享 协议 、 国 
际 政策 现 况 、 资 助 机 构 的 规则 与 要 求 
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所 以 ,为 支持 图 书馆 界 从 事 教 育 科 研 人 员 在 数据 权益 者 所 关心 的 不 同 问题 ,这 些 包 括 ; 科 研 人 员 、 学 术 
蕊 理 上 的 服务 ,以 及 支持 图 书馆 界 作 为 面向 创新 型 站 社 群 机构 研究 资助 者 .出 版 商 、 公众 等 的 各 自 相 与 
会 的 知识 管理 基础 设施 ,科研 数据 权益 管理 政策 服务 的 权利 与 利益 ,对 科研 数据 权益 管理 提出 复杂 的 要 求 
的 需求 日 益 凸 显 。 为 此 ,需要 组 织 起 政策 研究 咨询 团 和 挑战 ,需要 未 来 在 实践 中 逐步 梳理 和 呈现 。 本 文 所 
队 的 服务 工作 ,以 期 阶段 性 支持 图 书馆 顺利 开展 这 项 成 的 政策 研究 框架 ,对 于 一 般 情况 下 的 记录 、 存 储 、 
新 兴业 务 。 保存 发 布 文件 的 措施 ,具有 参考 意义 ,比如 :管理 者 


it 


需要 考虑 数据 重用 能 力 、 数 据 授权 许可 、 开 放 性 、 科 研 
12 未 来 展望 :支持 科研 生命 周期 的 科研 数据 权 S ee 
B IHY BY te zs o 
zc Im ARS e S 
WERT RR HESS 综 上 所 述 RB — £8 EG TE TRBS UA, TE SCRI 
A OT HE AE dm 8 83 , Rs RO CE RR. 研 数据 管理 以 及 权益 政策 制定 的 过 程 中 ,需要 考虑 。 
藏 .共享 等 。 在 每 个 不 同 阶段 中 , 均 有 各 个 参与 者 和 综合 考虑 的 议题 ,整理 如 表 18 所 示 。 
表 18 科研 数据 权益 政策 的 主要 元 素 
数据 权益 范围 rural | 数据 控制 手段 Fo9i 数据 开放 程度 To 
BHAA 匿名 化 可 访问 性 
合法 商业 利益 有 限 访问 可 评价 性 
国家 安全 机 密 封闭 化 可 解读 性 
个 人 隐私 权 jt BA 可 使 用 性 
知情 同意 权 技术 保护 措施 可 重用 性 
数字 著作 权 管 理 可 操作 性 
到 1 中 各 个 政策 层级 均 需 重视 表 15 的 内 容 ， CE. 
然而 它们 应 该 有 所 不 同 的 重点 。 全 球 学 术 社 群 和 政 - 匿名 化 (Anonymisation) :在 数字 数据 环境 中 保 
府 监管 部 门 需要 充分 重视 的 数据 权益 范围 护 隐 私 的 作法 。 
- 公共 知情 权利 (Public right to know) :人 民有 权 - 有 限 访问 (limited Access) ;发布 元 数据 提供 检 
利 知 道 向 政府 纳税 后 的 科研 调查 数据 。 索 , 但 是 不 提供 全 文 检索 或 者 全 文 获取 ,或 者 通过 
- 合法 商业 利益 (Commercial Benefit). 从 事 数 据 注册 机 制 或 者 网 域 识 别 ,对 来 访 实施 不 同 程度 
服务 的 企业 有 权 获 得 合理 利润 。 的 限制 。 
- 国家 安全 机 密 (National security secrets) ;国家 - 封闭 化 (Closed) ;在 系统 上 实施 开放 数据 、 开 放 
出 于 安全 防卫 需要 ,而 隐 和 英和 保护 若干 数据 ,通常 情 系统 架构 、 开 放 关 联 数据 、 开 放 平 台 、 知 识 元 库 等 的 接 
况 IN ,只 提供 结果 而 下 提供 推 sj DE 结果 过 程 的 科 封闭 ,使 得 数据 EM REA Jo 
研 数据 。 - ANS BB (Embargo): Hk AAA, EER 


- MARMY (Personal privacy) :数据 涉及 到 人 间 内 ,不 实施 开放 共享 的 时 间 跨 度 ; 不 同 的 出 版 商 、 科 


类 主体 (Human bodies) 时 ,需要 保护 个 人 隐私 ,无 论 是 研 机 构 、 资 助 机 构 会 有 不 同 的 时 沛 期 要 求 , 例 如 6 个 
接 披 露 个 人 信息 或 者 间接 得 以 为 第 三 方 获取 个 人 或 者 12 个 月 。 
言 息 的 信息 。 > 技术 保护 措施 (TPM) : 通过 硬件 或 软件 或 者 综 


- 知情 同意 权 (Informed Consent) ; 数据 采集 时 的 合 两 者 ,以 防止 或 限制 复制 ,以 及 控制 访问 和 数字 内 
对 象 涉及 人 类 主体 时 ,以 及 数据 访问 的 记录 涉及 终端 容 的 技术 手段 。 

时 , 均 需 使 其 有 足够 完整 的 信息 告知 ,使 其 形式 “数字 著作 权 管 理 (DRM) : 在 格式 转换 和 档案 迁 
我 决策 。 移 上 , 透 过 多 重 签名 认证 手段 ,达到 对 用 户 使 用 内 容 
资助 机 构 与 科研 机 构 需 要 充分 重视 的 数据 控制 的 限制 。 
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以 及 项 目 小 组 和 科研 人 员 需 要 充分 重视 的 数据 的 形式 。 
WEE: - 可 重用 性 (reuse available) :根据 开放 许可 使 得 
“可 访问 性 (accessible) :数据 必须 配置 在 能 够 被 放 数 据 在 使 用 上 没有 任何 限制 。 
发 现 的 实物 以 及 能 够 被 使 用 的 形式 上 。 - 可 操作 性 (executable): 采 取 便 捷 的 、 可 修改 
> 可 评价 性 (accessable) :能够 判断 数据 或 者 信 的 、 以 及 可 以 被 检索 、 下 载 、 索 引 、 搜 索 的 开放 格式 。 
息 的 可 靠 性 。 数 据 必需 因为 不 同 受 众 而 有 差异 化 。 格式 应 该 是 机 械 可 读 的 ( 即 : 数据 有 合理 结构 ,人 允许 
数据 必须 提供 科学 工作 结果 的 账目 ,用 以 解读 和 仔 动 化 作业 处 理 )。 
检查 它们 。 为 了 顺利 开展 科研 数据 权益 政策 的 服务 工作 , 国 
“可 解读 性 (intelligible) :仔细 检查 某 事 。 受 众 需 家 科学 图 书馆 所 成 立 的 科技 信息 政策 研究 与 咨询 
要 能 够 对 交流 内 容 产 生 某 些 判断 和 评价 ,他 们 需要 判 心 积 极 面 向 社会 各 界 , 特 别 是 图 书馆 行业 的 同仁 , + 
断 论点 的 本 质 , 需 要 判断 产生 这 些 论点 的 完整 性 和 可 求 共同 开发 或 者 纯 以 学 术 交 流 和 经 验 交 换 为 目的 的 
靠 性 。 “问题 解决 方案 (Solution) 合作。 图 2 显示 这 种 交流 
- 可 使 用 性 (useable) :数据 或 者 信息 能 够 被 使 合作 的 循环 过 程 和 互助 方式 。 


科研 数据 权益 管理 的 政策 层面 科研 数据 权益 管理 的 行动 层面 


科技 信息 政策 中 心 人 员 ( 研究 ) + 科研 数据 权益 管理 人 员 ( 业务 ) 
= 科研 数据 权益 管理 政策 的 理论 研究 与 管理 实践 


图 2 科研 数据 权益 管理 政策 的 合作 模式 


科技 信息 政策 研究 与 服务 咨询 中 心 , 定 期 从 事 医 经 验 、 理 论 方案 上 的 不 足 之 处 ,持续 进行 情报 知识、 
内 外 相关 政策 的 动态 扫描 与 政策 梳理 ,针对 有 意义 的 行动 的 改进 ,力求 能 够 促使 合作 伙伴 的 现 况 最 优化 。 
课题 或 者 重大 战略 发 展 的 需求 ,进行 专案 调查 或 者 政 根据 这 套 合作 模式 与 图 1 所 述 的 政策 层级 框架 ， 
策 分 析 ,最终 交付 具体 实施 方案 于 决策 管理 层 , 提供 以 及 前 述 的 科研 数据 使 用 .引用 存储、 传播、 共享 等 


统筹 规划 和 政策 制定 的 工作 。 面 向 馆 内 、 馆 外 、 院 内 、 权益 议题 等 科学 数据 权益 分 析 的 基本 框架 ,未 来 将 会 
院外 等 不 同 实施 科研 数据 管理 的 单位 或 者 部 门 , 提 供 逐一 发 布 经 过 调研 与 实践 后 所 形成 的 各 策 指 南 。 
信息 政策 模板 或 者 政策 建议 ,同时 吸收 与 学 习 这 些 单 前 ,在 国家 科学 图 书馆 的 科技 信息 政策 中 心 ,已 经 
位 的 宝贵 经 验 与 实施 情境 。 在 此 过 程 中 ,挖掘 与 发 现 全 文 翻译 了 《G8 开放 数据 宪章 与 技术 附件 入、 
政策 中 心 在 面 对 实 际 从 事 有 关 工 作 的 合作 伙伴 时 ,在 放 数 据 行政 命令 与 实施 细节 》"*" 《 出 版 商 和 大 学 
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科学 数据 权益 分 析 的 基本 框架 


Basic Framework of the Analysis on Research Data Rights 
顾 立 平 


对 OSTP 强制 政策 的 应 对 措施 )"" 《科研 数 据 的 处 
BRU! 《数据 管理 计划 检查 表 》" 《著作 作者 
的 创作 共用 指南 )""” 等 一 系列 政策 文件 ,并 且 即 将 发 
布 (图 书馆 著作 权 动 态 ) 的 特刊 :科研 数据 权益 管理 。 
未 来 将 有 更 多 的 进 阶 研究 。 抛 砖 引 玉 ,是 以 为 文 。 
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